智能论文笔记

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

Learning from Symmetry: Meta-Reinforcement Learning with Symmetric Data and Language Instructions

Xiangtong Yao , Zhenshan Bing , Genghang Zhuang , Kejia Chen , Hongkuan Zhou , Kai Huang , Alois Knoll

分类：人工智能

2022-09-21

元强化学习（META-RL）是一种有前途的方法，使代理商能够快速学习新任务。但是，由于仅由奖励提供的任务信息不足，大多数元元素算法在多任任务方案中显示出较差的概括。语言条件的元RL通过匹配语言指令和代理的行为来改善概括。因此，从对称性学习是人类学习的一种重要形式，因此将对称性和语言指令结合到元素rl可以帮助提高算法的概括和学习效率。因此，我们提出了一种双MDP元提升学习方法，该方法可以通过对称数据和语言指令有效地学习新任务。我们在多个具有挑战性的操作任务中评估了我们的方法，实验结果表明我们的方法可以大大提高元强化学习的概括和效率。

translated by 谷歌翻译

Meta-Reinforcement Learning via Language Instructions

Zhenshan Bing , Alexander Koch , Xiangtong Yao , Fabrice O. Morin , Kai Huang , Alois Knoll

分类：机器人

2022-09-11

尽管最近的强化学习最近在学习复杂的行为方面非常成功，但它需要大量的数据才能学习任务，更不用说能够适应新任务了。引起这种限制的根本原因之一在于试验学习范式的强化学习范式的性质，在这种情况下，代理商与任务进行交流并进行学习仅依靠奖励信号，这是隐含的，这是隐含的和不足以学习的一项任务很好。相反，人类主要通过语义表征或自然语言指示来学习新技能。但是，将语言指示用于机器人运动控制来提高适应性，这是一个新出现的主题和挑战。在本文中，我们提出了一种元素算法，该算法通过多个操纵任务中的语言说明来解决学习技能的挑战。一方面，我们的算法利用语言指令来塑造其对任务的解释，另一方面，它仍然学会了在试用过程中解决任务。我们在机器人操纵基准（Meta-World）上评估了算法，并且在培训和测试成功率方面显着优于最先进的方法。该代码可在\ url {https://tumi6robot.wixsite.com/million}中获得。

translated by 谷歌翻译

Outpainting by Queries

Kai Yao , Penglei Gao , Xi Yang , Kaizhu Huang , Jie Sun , Rui Zhang

分类：计算机视觉

2022-07-12

基于卷积神经网络（CNN）框架对图像支出进行了很好的研究，最近引起了计算机视觉的更多关注。但是，CNN依靠固有的电感偏见来实现有效的样品学习，这可能会降低性能上限。在本文中，以最小的变压器体系结构中的柔性自我发挥机制的启发，我们将广义图像支出问题重新构架为贴片的序列到序列自动估计问题，从而使基于查询的图像映射出现。具体而言，我们提出了一个新型混合视觉转换器基于编码器框架，名为\ textbf {query} \ textbf {o} utpainting \ textbf {trextbf {tr} ansformer（\ textbf {queryotr}）围绕给定的图像。 Patch Mode的全球建模能力使我们可以从注意机制的查询角度推断图像。新颖的查询扩展模块（QEM）旨在根据编码器的输出从预测查询中整合信息，因此即使使用相对较小的数据集，也可以加速纯变压器的收敛性。为了进一步提高每个贴片之间的连接性，提议的贴片平滑模块（PSM）重新分配并平均重叠区域，从而提供无缝的预测图像。我们在实验上表明，QueryOtr可以针对最新的图像支出方法平稳和现实地产生吸引力的结果。

translated by 谷歌翻译

Mind The Gap: Alleviating Local Imbalance for Unsupervised Cross-Modality Medical Image Segmentation

Zixian Su , Kai Yao , Xi Yang , Qiufeng Wang , Yuyao Yan , Jie Sun , Kaizhu Huang

分类：计算机视觉

2022-05-24

无监督的交叉模式医学图像适应旨在减轻不同成像方式之间的严重域间隙，而无需使用目标域标签。该活动的关键依赖于对齐源和目标域的分布。一种常见的尝试是强制两个域之间的全局对齐，但是，这忽略了致命的局部不平衡域间隙问题，即，一些具有较大域间隙的局部特征很难转移。最近，某些方法进行一致性，重点是地方区域，以提高模型学习的效率。尽管此操作可能会导致上下文中关键信息的缺陷。为了应对这一限制，我们提出了一种新的策略，以减轻医学图像的特征，即全球本地联盟的一致性，以减轻域间隙不平衡。具体而言，功能 - 触发样式转移模块首先合成类似目标的源包含图像，以减少全局域间隙。然后，集成了本地功能掩码，以通过优先考虑具有较大域间隙的判别特征来减少本地特征的“间隙”。全球和局部对齐的这种组合可以精确地将关键区域定位在分割目标中，同时保持整体语义一致性。我们进行了一系列具有两个跨模式适应任务的实验，i，e。心脏子结构和腹部多器官分割。实验结果表明，我们的方法在这两个任务中都达到了最新的性能。

translated by 谷歌翻译

A Learned Index for Exact Similarity Search in Metric Spaces

Yao Tian , Tingyun Yan , Xi Zhao , Kai Huang , Xiaofang Zhou

分类：机器学习

2022-04-21

索引是支持大型数据库中有效查询处理的有效方法。最近，已积极探索了替代或补充传统索引结构的学习指数的概念，以降低存储和搜索成本。但是，在高维度空间中准确有效的相似性查询处理仍然是一个开放的挑战。在本文中，我们提出了一种称为LIMS的新型索引方法，该方法使用数据群集，基于枢轴的数据转换技术和学习的索引来支持度量空间中的有效相似性查询处理。在LIM中，将基础数据分配到簇中，使每个群集都遵循相对均匀的数据分布。数据重新分布是通过利用每个集群的少量枢轴来实现的。类似的数据被映射到紧凑的区域，而映射的值是完全顺序的。开发机器学习模型是为了近似于磁盘上每个数据记录的位置。有效的算法设计用于基于LIMS的处理范围查询和最近的邻居查询，以及具有动态更新的索引维护。与传统索引和最先进的学习索引相比，对现实世界和合成数据集的广泛实验证明了LIM的优势。

translated by 谷歌翻译

Knee Cartilage Defect Assessment by Graph Representation and Surface Convolution

Zixu Zhuang , Liping Si , Sheng Wang , Kai Xuan , Xi Ouyang , Yiqiang Zhan , Zhong Xue , Lichi Zhang , Dinggang Shen , Weiwu Yao

分类：计算机视觉

2022-01-12

膝关节骨关节炎（OA）是最常见的骨关节炎和伤残原因。软骨缺陷被认为是膝关节OA的主要表现，其通过磁共振成像（MRI）可见。因此，对膝关节软骨缺陷的早期检测和评估对于保护膝关节OA患者来说是重要的。通过这种方式，通过将卷积神经网络（CNNS）应用于膝关节MRI，已经在膝关节软骨缺陷评估中进行了许多尝试。然而，软骨的生理特性可能阻碍这种努力：软骨是薄的弯曲层，这意味着只有膝关节MRI中的一小部分体素可以有助于软骨缺陷评估;异构扫描方案进一步挑战CNN在临床实践中的可行性;基于CNN的膝关节软骨评估结果缺乏解释性。为了解决这些挑战，我们将软骨结构和外观模拟到膝关节MRI进入图表表示，该图表能够处理高度多样化的临床数据。然后，由软骨图表示指导，我们设计了一种具有自我关注机制的非欧几里德深度学习网络，提取本地和全局中的软骨功能，并通过可视化结果导出最终评估。我们的综合实验表明，该方法在膝关节软骨缺陷评估中产生了卓越的性能，以及其方便的可解释性3D可视化。

translated by 谷歌翻译

CrossMoDA 2021 challenge: Benchmark of Cross-Modality Domain Adaptation techniques for Vestibular Schwnannoma and Cochlea Segmentation

Reuben Dorent , Aaron Kujawa , Marina Ivory , Spyridon Bakas , Nicola Rieke , Samuel Joutard , Ben Glocker , Jorge Cardoso , Marc Modat , Kayhan Batmanghelich

分类：计算机视觉

2022-01-08

域适应（DA）最近在医学影像社区提出了强烈的兴趣。虽然已经提出了大量DA技术进行了用于图像分割，但大多数这些技术已经在私有数据集或小公共可用数据集上验证。此外，这些数据集主要解决了单级问题。为了解决这些限制，与第24届医学图像计算和计算机辅助干预（Miccai 2021）结合第24届国际会议组织交叉模态域适应（Crossmoda）挑战。 Crossmoda是无监督跨型号DA的第一个大型和多级基准。挑战的目标是分割参与前庭施瓦新瘤（VS）的后续和治疗规划的两个关键脑结构：VS和Cochleas。目前，使用对比度增强的T1（CET1）MRI进行VS患者的诊断和监测。然而，使用诸如高分辨率T2（HRT2）MRI的非对比度序列越来越感兴趣。因此，我们创建了一个无人监督的跨模型分段基准。训练集提供注释CET1（n = 105）和未配对的非注释的HRT2（n = 105）。目的是在测试集中提供的HRT2上自动对HRT2进行单侧VS和双侧耳蜗分割（n = 137）。共有16支球队提交了评估阶段的算法。顶级履行团队达成的表现水平非常高（最佳中位数骰子 - vs：88.4％; Cochleas：85.7％）并接近完全监督（中位数骰子 - vs：92.5％;耳蜗：87.7％）。所有顶级执行方法都使用图像到图像转换方法将源域图像转换为伪目标域图像。然后使用这些生成的图像和为源图像提供的手动注释进行培训分割网络。

translated by 谷歌翻译

PointNu-Net: Simultaneous Multi-tissue Histology Nuclei Segmentation and Classification in the Clinical Wild

Kai Yao , Kaizhu Huang , Jie Sun , Amir Hussain , Curran Jude

分类：计算机视觉

2021-11-01

自动核细胞分割和分类在数字病理学中起着至关重要的作用。但是，以前的作品主要基于具有有限的多样性和小尺寸的数据构建，使得在实际下游任务中的结果可疑或误导。在本文中，我们的目标是建立一种可靠且强大的方法，能够处理“临床野生”中的数据。具体地，我们研究和设计一种同时检测，分段和分类来自血红素和曙红（H＆E）染色的组织病理学数据的新方法，并使用最近的最大数据集评估我们的方法：Pannuke。我们以新颖的语义关键点估计问题解决每个核的检测和分类，以确定每个核的中心点。接下来，使用动态实例分段获得核心点的相应类别 - 不可止液掩模。通过解耦两个同步具有挑战性的任务，我们的方法可以从类别感知的检测和类别不可知的细分中受益，从而导致显着的性能提升。我们展示了我们提出的核细胞分割和分类方法的卓越性能，跨越19种不同的组织类型，提供了新的基准结果。

translated by 谷歌翻译

A DCNN-based Arbitrarily-Oriented Object Detector for Quality Control and Inspection Application

Kai Yao , Alberto Ortiz , Francisco Bonnin-Pascual

分类：计算机视觉

2021-01-19

遵循机器视觉系统在线自动化质量控制和检查过程的成功之后，这项工作中为两个不同的特定应用提供了一种对象识别解决方案，即，在医院准备在医院进行消毒的手术工具箱中检测质量控制项目，以及检测血管船体中的缺陷，以防止潜在的结构故障。该解决方案有两个阶段。首先，基于单镜头多伯克斯检测器（SSD）的特征金字塔体系结构用于改善检测性能，并采用基于地面真实的统计分析来选择一系列默认框的参数。其次，利用轻量级神经网络使用回归方法来实现定向检测结果。该方法的第一阶段能够检测两种情况下考虑的小目标。在第二阶段，尽管很简单，但在保持较高的运行效率的同时，检测细长目标是有效的。

translated by 谷歌翻译